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[目的 /意义 ] 与 确定 泄露 的 情境 相 比 ,个 人 数据 以 一 定 概 率 泄露 的 情境 更 为 普遍 。 由 此 计量 泄露 概率 情境 下 的 用 


户 个 人 隐私 价值 ,提出 隐私 计量 的 新 视角 ,计量 结果 对 隐私 分 级 保护 也 具有 实际 意义 。[ 方 法 /过 程 ] 基 于 多 级 价 
格 表 的 方法 ,计量 用 户 的 金融 风险 回报 率 ; 基 于 用 户 的 金融 风险 回报 率 ,改造 多 级 价格 表 的 实现 机 制 ,引导 用 户 在 
无 隐私 泄露 概率 方案 和 存在 隐私 泄露 概率 的 方案 中 做 出 决策 ,测度 用 户 在 一 定 泄露 概率 情境 下 对 其 个 人 数据 的 
价值 认 知 。[ 结果 /结论 ] 在 泄露 概率 为 30% 的 情境 下 ,用 户 对 其 社交 网 络 中 的 个 人 数据 隐私 价值 认 知 约 为 89.5 


摘 要 : 
pm 

> 

Yum | " 

vo ”风险 容忍 度 两 个 方面 。 

SOR. 个 人 隐私 ”泄露 概率 ”隐私 价值 ”多 级 价格 表 机 制 
ide. ces 
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元 ;同时 ,在 泄露 概率 为 100% 的 情境 下 以 接受 意愿 和 支付 意愿 体现 的 个 人 数据 隐私 价值 分 别 为 124.1 和 93.8 
元 。 表 明 用 户 在 泄露 概率 情境 下 对 其 个 人 数据 隐私 价值 的 认 知 取决 于 个 人 数据 隐私 价值 本 身 和 用 户 对 泄露 概率 


.大 数据 背景 下 ,个 人 数据 隐私 问题 吸引 了 广泛 的 
社会 关注 。 无 论 是 政府 公共 部 门 还 是 社会 企业 组 织 都 
仿 削 到 海量 个 人 数据 蕴含 巨大 价值 ,比如 公共 部 门 通 
过 波 集 整合 个 人 数据 有 助 于 提高 社会 服务 效率 ;企业 
组 强 通 过 挖 气 、 分 析 个 人 数据 有 助 于 提供 个 人 定制 服 
488. IRTI, 4E fbi 1.3 亿 用 户 个 人 数据 泄露"""、 
“ 领 英 1.59 亿 用 户 敏感 数据 泄露 ”等 层出不穷 的 个 
人 数据 泄露 事件 严重 威胁 到 了 社会 公众 的 切身 利益 安 
全 ,公众 逐渐 意识 到 保护 个 人 数据 隐私 的 必要 性 。 

用 户 在 披露 个 人 数据 后 带 来 的 便捷 服务 和 隐私 风 
险 之 间 做 抉择 时 ,会 权衡 成 本 与 收益 ,成 本 如 隐私 汇 
FE .价格 歧 视 .身份 盗窃 等 ,收益 如 个 性 化 服务 .价格 折 
扣 等 。 企 业 在 收集 .使 用 用 户 数据 时 , 需 权衡 用 户 隐 私 
保护 支出 与 企业 收入 提升 之 间 的 关系 。 平 衡 隐 私 关注 
是 企业 和 用 户 两 者 都 面临 的 一 个 环 手 问题 ,解决 这 个 
问题 的 关键 是 计量 用 户 个 人 数据 的 隐私 价值 。 计 量 用 
户 个 人 数据 的 隐私 价值 一 方面 能 够 帮助 企业 制定 差异 


化 隐私 保护 政策 ,提高 隐私 保护 效率 ,降低 隐私 保护 成 
本 ; 男 一 方面 ,能 够 为 公共 部 门 制定 用 户 个 人 数据 隐私 
汇 露 的 赔偿 标准 提供 参考 。 

个 人 数据 存在 泄露 概率 ,目前 的 研究 均 集 中 在 个 
人 数据 确定 泄露 的 情境 ,但 客观 上 ,泄露 是 一 个 概率 性 
有 件 。 因 此 ,计量 在 一 定 泄露 概率 条 件 下 ,用户 对 其 个 
人 数据 隐私 价值 的 认 知 也 具 实 际 意义 。 


2 个 人 数据 隐私 价值 计量 相关 研究 


已 有 的 个 人 数据 隐私 价值 计量 相关 研究 汇总 见 表 1。 

根据 表 1, 已 有 的 实证 研究 主要 计量 个 人 数据 隐 
私 的 货币 价值 ,表现 形式 有 两 种 :用 户 愿意 为 保护 其 
个 人 数据 隐私 免 遭 侵犯 而 支付 的 货币 价格 (Willing to 
Pay ,WTP) 。 如 ,S，Fgelman 等 "通过 离散 选择 分 析 法 
计量 得 出 用 户 位 置 数据 和 通话 记录 的 WTP 约 为 1.5 
美元 ;J，Kim 45 P 通过 联合 分 析 法 计量 得 出 韩国 公众 
平均 每 月 愿意 花费 约 6. 8 美元 用 于 个 人 信息 保护 服 
务 。@ 用 户 愿 意 牺牲 其 个 人 数据 隐私 而 能 够 接受 的 货 
币 补偿 价格 (Willing to Accept,WTA) 。 如 , 臧 国 全 等 …” 


«lin. 
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表 1 已 有 的 个 人 数据 隐私 价值 计量 相关 研究 


价值 表现 计量 方法 作者 ( 发 表 年 ) 
支付 意愿 居 合 分 析 法 I. H. Hann 等 3](2002) ;A. Acquisti 等 [4](2012) 
离散 选择 分 析 法 D. Potoglou 等 55](2013 ) ;S. Lim 等 [61(2018 ) ; 邓 胜 利 等 [71(2019) 
条 件 价值 法 J. Grossklags 45/52 (2007) ; 3353] 9! (2017) 
日 卖 实 验 法 B. A. Huberman 等 [101(2005 ) ; 3i [x] 4» 45:113 (2020) 
接受 意愿 居 合 分 析 法 H. Krasnova 等 [12](2009) ;J. Kim 等 103](2015 ) ; Y. Pu 等 L141(2016) 
离散 选择 分 析 法 J. Y. Tsai 等 015](2011 ) ;A. R. Beresford 等 116](2012 ) ;S. Egelman 等 [17](2013 ) ;H.. Krasnova 等 [18](2014) 
条 件 价值 法 J. E. Kim 等 119](2010) ;M. Otsuki 4120] (2013) 
自 卖 实验 法 G. Danezis 等 [21](2005 ) ;S. Spiekermann 等 [22](2012 ) 


基于 改造 过 的 BDM 机 制 计 量 得 出 用 户 个 人 偏好 数据 、 
联系 资料 数据 的 WTA 4312929 38. 8 元 .136.3 元 ; 黄 
逸 朝 等 中 采用 条 件 价 值 法 调查 得 出 用 户 年 龄 数据 和 家 
庭 地 址 的 WTA 分 别 约 为 6. 99 元 .66. 19 元。 

根据 表 1 ,已 有 的 个 人 数据 隐私 价值 计量 方法 可 
分 为 问卷 调查 法 和 拍卖 实验 法 两 类 :问卷 调查 法 
人 包 播 联合 分 析 法 ( Conjoint Analysis) ,离散 选择 分 析 
Ws CDiscrete Choice Analysis ) 和 条 件 价值 法 (Contin- 
géfib Valuation Method) 。 其 中 ,联合 分 析 法 和 离散 选 
把 狗 析 法 均 是 根据 产品 属性 及 属性 水 平 构建 产品 轮 


miim 


ORA IE 28 EJER — E ctt f n s 4 LH — 3 9 E 


其 爹 人 数据 隐私 的 WTP 或 WTA。 外 拍卖 实验 法 包 


Vie rot Qn -1 个 最 高 竞价 者 获胜 ,并 支 
ITEE n 个 最 高 价 ) Becker DeGroot Marschak ( BDM ) 
拍 实 法 (竞价 者 与 随机 函数 竞价 ,竞价 者 价格 高 于 
随 狗 函 数 返回 的 价格 时 ,竞价 者 获胜 ,并 以 随机 随 
机 通 数 返回 的 价格 支付 ) 和 随机 N 级 价格 拍卖 法 
(竞价 者 i 是 与 其 他 N-1 位 参与 者 竞价 ,随机 抽取 
N 位 竞拍 者 中 的 一 个 出 价 作为 市 场 出 清 价 格 ,出 价 
大 于 或 等 于 该 价格 的 竞价 者 获胜 ,并 以 该 价格 支 
AT) o FEP pn 级 价格 拍卖 法 和 随机 N 级 价格 拍卖 
法 适用 于 同类 多 件 物品 拍卖 ,BDM 拍卖 法 适用 于 单 
件 物品 拍卖 。 

由 上 可 知 ,4 种 主要 计量 方法 中 ,每 种 方法 都 可 以 
从 支付 意愿 和 接受 意愿 两 个 维度 计量 个 人 数据 隐私 价 
值 。 尽 管 计量 结果 可 能 存在 差异 ,但 不 影响 个 人 数据 
隐私 价值 大 小 的 相对 性 特质 。 
全 面 考察 上 述 隐 私 价值 测量 的 问卷 调查 法 和 拍卖 
实验 法 的 实证 研究 后 ,作者 发 现 已 有 研究 均 假定 个 人 
隐私 确定 泄露 ,没有 考虑 仅 以 一 定 概率 泄露 的 情况 。 
实际 上 ,个 人 隐私 决策 不 仅 取决 于 个 人 数据 隐私 本 身 


价值 ,还 包括 泄露 概率 。 完 全 确定 泄露 与 一 定 可 能 ! 
泄露 导致 的 个 人 隐私 关注 程度 可 能 存在 差异 ,比如 ,个 
人 数据 保存 系统 中 的 隐私 保护 措施 就 是 为 了 降低 隐私 
泄露 概率 从 而 减轻 用 户 隐 私 担 忧 。 因 此 ,本 研究 拟 测 
度 用 户 在 泄露 概率 情境 下 对 其 个 人 数据 隐私 的 价值 认 
知 , 简 称 泄 露 概 率 隐 私 价值 (Value of Privacy under 
Leakage Probability , VPLP ) 。 


3 ”计量 模型 


风险 的 涵义 是 不 期 望 事 件 的 发 生 概率 ” 。 因 此 ， 
风险 的 构成 有 两 个 要 素 :不 期 望 事 件 ,发生 概率 。 个 人 
数据 的 隐私 泄露 是 一 个 风险 事件 ,因为 ,个 人 数据 的 泄 
露 是 数据 主体 不 期 望 发 生 的 事件 ,同时 ,泄露 本 身 又 是 
一 个 概率 性 事件 。 在 个 人 数据 保存 系统 中 ,个 人 数据 
可 能 被 泄露 ,也 可 能 不 被 泄露 ,取决 于 安全 保护 措施 ， 
保护 措施 越 严 格 ,泄露 概率 越 低 , 反 之 ,泄露 概率 越 高 。 
因此 ,本 文 使 用 “隐私 泄露 风险 ”来 显 性 地 表达 “隐私 
泄露 这 类 事件 的 发 生 概率 ”。 

本 研究 采用 多 级 价格 表 机 制 ( Multiple Price List, 
MPL) ,设计 易于 理解 的 金融 概率 风险 多 级 价格 表 , 计 
量 用 户 金 融 风 险 回 报 率 (Return on Financial Risk, 
RFR)。 基 于 用 户 金 融 风 险 回报 率 的 计量 结果 ,测度 用 
户 在 泄露 概率 情境 下 的 个 人 数据 隐私 价值 认 知 。 

3.1 金融 风险 回报 率 

MPL 机 制 是 实验 经 济 学 领域 测量 用 户 风险 态度 的 
一 种 常用 手段 ,最早 由 H. P. Binswanger ”提出 ,通过 
向 用 户 展示 一 系列 不 同 收益 的 方案 组 合 ,每 个 组 合 中 
均 有 一 个 安全 方案 (不 存在 损失 的 概率 ) 和 风险 方案 
(存在 损失 的 概率 ) ,安全 方案 的 固定 收益 逐 行 递减 ， 
而 所 有 风险 方案 的 期 望 收益 相同 ,询问 用 户 在 安全 方 
案 的 固定 收益 降低 至 哪个 水 平时 ,会 放弃 安全 收益 而 
选择 追求 可 能 更 高 的 风险 收益 ,通过 观察 用 户 决策 间 
接 推理 出 用 户 的 风险 态度 。 采 用 MPL 机 制 , 设 计 RFR 
多 级 价格 表 , 如 表 2 所 示 : 
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表 2 RFR 多 级 价格 


行 号 方案 A 方案 B 
0 您 可 获得 您 可 获得 y 元 ,但 有 p 的 概率 损失 。 元 , 即 您 有 (1 
x 元 -了 ) 的 概率 获得 元 ,有 p 的 概率 获得 (y - e) 26 
1 您 可 获得 您 可 获得 y 元 ,但 有 p 的 概率 损失 。 元 , 即 您 有 (1 


— 
* 


-a)J6 -了 ) 的 概率 获得 元 ,有 p 的 概率 获得 (y - 0) 76 
1 


2 您 可 获得 您 可 获得 y 元 ,但 有 p 的 概率 损失 < 元 , 即 您 有 (1 
(x -2a) JÙ -7) 的 概率 获得 y 元 ,有 p 的 概率 获得 (y 7 c) 76 


k 您 可 获得 您 可 获得 y 元 ,但 有 p 的 概率 损失 。 元 , 即 您 有 (1 
(x-k*a)ŭ 。 -了 ) 的 概率 获得 y 元 ,有 p 的 概率 获得 (y -<) 元 


表 2 包含 两 个 方案 :方案 A 为 安全 方案 ,收益 以 a 
元 逐 行 递减 ,在 第 ; 行 ,方案 A 的 收益 为 Y(4,) =x - i 
sujie [0,5] ;方案 B 为 风险 方案 (有 p 的 概率 损失 < 
元 ) ,每 行 方案 B 期 望 收益 为 BCB) =y* (1-p) +(y 
7e) sp. 当 用 户 决策 在 第 ; 行 由 方案 A 转向 方案 B 
时 5 代表 用 户 舍弃 安全 收益 而 选择 风险 收益 ,此 时 该 用 
FT RFR 为 : 

S prrs EEA 
3 于 泄露 概率 隐私 价值 计量 
CO 通过 将 RFR 多 级 价格 表 ( 见 表 2) 中 方案 B 的 “有 
p yt itc e TUEK p 的 概率 个 人 隐私 被 江 
替 避 可 以 模拟 出 真实 的 泄露 概率 情境 ,从 而 形成 VPLP 
多 级 价格 表 ( 见 表 3) 。 隐 私 价值 是 隐私 主体 对 隐私 客 
体 遭 受 侵犯 时 可 能 导致 的 损失 估计 ,这 种 损失 包含 人 
格 本 财产 两 个 方面 (经 济 社会 的 发 展 导致 人 格 损失 的 
财 至 化 转换 越 来 越 普遍 ) ,可 用 货币 价格 表示 用 户 对 这 
类 隐私 价值 的 认 知 。 因 此 ,在 VPLP 多 级 价格 表 中 方 
案 虽 可 货币 化 表示 为 "您 可 获得 ;元 ,但 有 2 的 概率 损 
R wplp 元 ”。 


e [0,4] 


X3 VPLP 多 级 价格 


行 导 方案 A 方案 B 
0 您 可 获得 您 可 获得 y 元 ,但 有 p 的 概率 泄露 您 的 个 人 隐私 ， 
x 元 即 , 您 可 获得 y 元 ,但 有 p 的 概率 损失 vplp 元 
1 您 可 


可 获得 您 可 获得 y 元 ,但 有 p 的 概率 泄露 您 的 个 人 隐私 ， 
即 , 您 可 获得 y 元 ,但 有 p 的 概率 损失 vplp 元 

2 您 可 获得 您 可 获得 y 元 ,但 有 p 的 概率 泄露 您 的 个 人 隐私 ， 
(x -24q) 元 ” 即 ,您 可 获得 y 元 ,但 有 p 的 概率 损失 vplp 元 


k 您 可 获得 您 可 获得 y 元 ,但 有 p 的 概率 泄露 您 的 个 人 隐私 ， 
(x-k*a)76 ” 即 ,您 可 获得 y 元 ,但 有 p 的 概率 损失 vplp 元 


基于 表 3 的 设计 ,将 用 户 的 隐私 决策 转换 为 在 金 
融 情境 下 安全 方案 和 风险 方案 之 间 的 决策 。 实 际 上 ， 
表 2 情境 属于 直接 金融 情境 (所 有 金融 要 素 直 接 采 用 
货币 形式 表达 ) , 表 3 情境 属于 间接 金融 情境 (VPLP 以 


用 户 价 值 认 知 方式 间接 采用 货币 表达 ) 。 两 者 均 属于 
金融 领域 , 当 表 2、 表 3 情境 采用 相同 的 损失 概率 时 ,用 
户 在 表 2 和 表 3 情境 下 的 金融 风险 回报 率 应 该 相同 。 
由 此 推导 出 VPLP 的 计量 公式 为 : 

p27- (RFR+1) * (x-i*a) |. 

p 

其 中 ,i 为 用 户 在 表 3 中 的 选择 由 方案 A 转向 方案 
B 的 行 号 ,RFR 为 基于 表 2 计算 出 的 该 用 户 金融 概率 
风险 回报 率 。 


4 计量 实验 


4.1 个 人 数据 样本 

本 实验 通过 调查 问卷 的 方式 获取 个 人 基本 数据 和 
个 人 隐私 数据 样本 。 问 卷 应 包含 3 部 分 内 容 : 
4.1.1 人 口 统计 学 数据 

包括 用 户 姓 名 、 性 别 \ 年 龄 ,学 历 等 个 人 标识 和 半 
标识 数据 ,用 于 基于 人 口 统计 特征 的 泄露 概率 隐私 值 
分 析 。 
4.1.2 个 人 隐私 数据 

从 计量 模型 可 以 看 出 ,该 模型 适合 于 任何 领域 的 
个 人 隐私 数据 ,可 以 是 宏观 上 的 隐私 数据 条 目 , 也 可 以 
是 微观 上 的 隐私 数据 项 目 。 由 于 实验 过 程 中 ,可 能 需 
要 用 户 公 开 个 人 隐私 数据 ,因此 ,调查 中 用 户 个 人 隐私 
数据 需要 能 够 及 时 现场 提供 。 基 于 该 要 求 ,本 实验 选 
择 用 户 的 微 信 数据 (包括 微 信 账户 页 面 截 图 . 近 半 年 已 
发 布 朋友 圈 页 面 截 图 、 聊 天 主 界面 截图 等 ) 和 微 博 数据 
(包括 微 博 账 户 页 面 截图 . 近 半 年 已 发 布 微 博 页 面 截 
\ 近 半年 微 博 评论 界面 截图 等 ) 作为 用 户 个 人 隐私 数 
据 。 
4.1.3 个 人 隐私 价值 的 直接 认 知 数据 

目的 是 获取 用 户 对 其 个 人 隐私 价值 认 知 的 直接 报 
告 值 ,包括 用 户 为 保护 其 个 人 隐私 数据 而 愿意 支付 的 
价格 (WTP) 和 用 户 披 露 个 人 隐私 数据 时 能 够 接受 的 补 
偿 价格 (WTA ) 。 
4.2 实验 步骤 
4.2.1 步骤 1: 计 量 RFR 

首先 ,实验 者 向 用 户 发 放 一 张 RFR 多 级 价格 表 ， 
该 表 包 含 K+1 行 ,每 行 包括 安全 方案 A 和 风险 方案 
B, 用 户 需 在 每 一 行 两 个 方案 之 间 做 出 一 个 选择 。 其 
次 ,记录 用 户 决策 从 方案 A 转 至 方案 B 的 初始 行 号 ， 
计算 该 用 户 的 RFR。 最 后 ,采用 随机 函数 返回 一 个 0 
-k 的 行 号 i, 以 用 户 在 该 行 的 选择 向 用 户 支 付 实 验 报 
酬 。 奋 用 户 在 该 行 选 择 方案 A, 则 向 用 户 支 付 (x -i 


VPL [0,4] 
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a) 元 。 硝 在 该 行 选择 方案 B, 再 采用 [0,1] 随 机 函数 确 
定 方案 B 的 执行 结果 , 寿 随 机 函数 返回 值 大 于 p, 则 向 
用 户 支 付 y 元 ;反之 ,支付 (y -c) 元 (实验 者 已 在 实验 
协议 中 告知 用 户 , 基 于 实验 成 本 考虑 ,步骤 1 和 2 均 以 
50:1 的 比例 向 用 户 支 付 实际 金额 。)。 
在 RFR 实验 中 ,采用 随机 函数 确定 行 号 ,并 以 用 
户 在 该 行 的 选择 向 用 户 支 付 实验 报酬 ,目的 是 保证 用 
户 决 策 的 真诚 性 。 该 方法 源 自 于 Becker DeGroot Mar- 
schak ( BDM ) 拍卖 机 制 ” 的 思想 ,车 用 户 的 实际 选择 
与 真实 想法 不 同 ,随机 函数 返回 行 号 i 落 在 用 户 的 说 
谎 区 间 ,用 户 需 承担 方案 A、B 之 间 的 预期 收益 差 。 只 


4.3.2 参数 y 的 确定 

根据 前 景 理论 ” , 当 两 个 方案 的 期 望 收益 相等 
时 , 若 其 中 一 个 方案 存在 用 户 收益 为 负 值 的 情况 ,用户 
对 该 风险 (收益 为 负 ) 的 厌恶 会 降低 选择 该 方案 的 意 
愿 。 因 此 ,参数 y 的 取 值 应 大 于 VPLP 的 预 估 值 ,以 避 
免 用 户 选 择 方案 B 获取 的 货币 收益 不 足以 弥补 披露 个 
人 隐私 数据 带 来 的 损失 ,从 而 降低 其 选择 方案 B 的 意 
愿 。 作 者 在 以 往 的 研究 中 ,采用 BDM 拍卖 机 制 ,测量 
出 用 户 网 络 隐私 数据 的 WTA 21k 38. 8 - 237.9 元 之 
间 ""。 因 此 ,本 实验 基于 收集 的 个 人 隐私 样本 ,将 预 
实验 的 参数 y 设置 为 150 元 。 可 通过 预 实验 结果 验证 


有 当 用 户 实际 选择 与 真实 想法 一 致 时 ,不 需要 承担 额 
外 风险 。 因 此 ,该 方法 能 够 测量 用 户 真 实 的 RFR。 同 
理 * 在 下 述 步 又 2 中 ,同样 采用 该 方法 。 
4. P 步骤 2: 计 量 VPLP 
本 首先 ,实验 者 向 用 户 发 放 一 张 VPLP 多 级 价格 表 ， 
ARUE K +1 行 ,每 行 包括 安全 方案 A 和 风险 方案 
BE 用 户 需 在 每 一 行 两 个 方案 之 间 做 出 一 个 选择 。 殿 
次 s 记 录用 户 决策 从 方案 A 转 至 方案 B 的 初始 行 号 ， 
采 骨 该 用 户 的 RER ,计算 其 VPLP。 最 后 ,采用 随机 函 
PUREA O -k 的 行 号 ,以 用 户 在 该 行 的 选择 向 用 
» 


IS RESCRHUM EP EAT EFE TR. A, 则 向 
户 安 付 (x -ix a) 元 。 若 在 该 行 选择 方案 B, 再 采 
t] 随机 函数 确定 方案 B 的 执行 结果 。 若 随机 函数 
返 呵 值 大 于 ,向 用 户 支付 y 元 , 且 无 需 披露 用 户 个 人 
隐 肝 数据 ;反之 ,向 用 户 支付 y 元 ,但 需 向 实验 群 组 内 
所 给 用 户 披露 其 个 人 隐私 数据 ( 既 可 模拟 隐私 泄露 的 
真名 情景 ,也 可 控制 隐私 泄露 的 范围 ,以 避免 走 实 地 泄 
露 用 户 个 人 隐私 ) 。 
4.3 mM 

依据 正式 实验 的 目标 用 户 数量 ,根据 样本 抽样 数 
量 的 经 验 法 则 '“ ,计算 预 实验 的 用 户 数 量 。 此 次 仅 进 
f; VPLP 计量 预 实验 , 预 实 验 目 的 是 确定 相关 参数 。 
essi cune M. 
4.3.1 参数 x 的 确定 

参数 x 的 取 值 应 大 于 或 等 于 参数 y, 以 保证 所 有 用 
户 决策 均 存 在 从 方案 A 到 方案 B 的 变化 ,增加 实验 结 
果 的 可 信和 度 , 否 则 可 能 出 现 风险 厌恶 度 较 低 且 对 个 人 
隐私 价值 认 知 较 低 的 用 户 在 所 有 行 均 选 择 方案 B 的 现 
象 ,这 种 现象 无 法 计量 金融 风险 回报 率 , 导 致 也 无 法 计 
量 泄露 概率 隐私 值 。 当 然 ,最 简单 的 方法 是 将 参数 x 
的 取 值 设置 与 参数 y 相等 。 


el 


该 参数 的 取 值 是 否 合理 , 若 预 实验 中 大 多 数 用 户 均 未 
选择 过 方案 B ,或 仅 在 极 少 行 选择 方案 B ,说 明 参 数 7 


的 取 值 过 低 ,应 设置 更 高 的 y 值 ;反之 , 则 说 明 参 数 y 
的 取 值 合理 。 基 于 预 实验 结果 ,y=150 时 ,96.7% 的 用 
户 选择 过 方案 B 且 选 择 方案 B 的 平均 行 数 为 13 行 , 故 


将 参数 y 的 取 值 设置 为 150 元 是 合理 的 。 
4.3.3 ”参数 a 的 确定 

实际 上 ,参数 a 仅 反 映 方案 A 收益 的 递减 速率 ,其 
取 值 并 不 会 对 实验 结果 产生 明显 影响 。 但 参数 a 的 取 
值 也 不 能 过 大 或 过 小 ,参数 a 过 大 导致 相 邻 两 行 中 方 
案 A 的 收益 相差 过 多 ,可 能 无 法 准确 观察 用 户 的 决策 
行为 ;参数 a 过 小 导致 多 级 价格 表 的 行 数 过 多 ,可 能 影 
响 用 户 的 决策 体验 。 因 此 ,本 文 基于 参数 y 的 初始 值 ， 
将 参数 a 的 取 值 设置 为 5。 参 数 k 决定 多 级 价格 表 的 
行 数 ,只 有 当 多 级 价格 表 最 后 一 行 中 方案 A 的 期 望 收 
益 远 小 于 方案 B 时 , 才 可 能 存在 用 户 决策 从 方案 A 转 
向 方案 B。 因 此 ,基于 参数 a. 的 取 值 ,本 文 将 参数 上 的 
取 值 设置 为 19( 总 行 数 为 k+1 行 , 共 20 行 ), 即 在 多 
级 价格 表 最 后 一 行 中 方案 A 的 收益 为 55 元 。 
4.3.4 概率 的 确定 

设 定 概率 p 时 应 考虑 现实 情况 下 的 隐私 泄露 状 
DL ,最 理想 的 方式 是 统计 全 社会 的 个 人 隐私 数据 总 量 
和 被 泄露 的 个 人 隐私 数据 量 , 据 此 计算 现实 情况 下 的 
隐私 泄露 概率 。 然 而 ,作者 经 过 多 方 检索 均 未 发 现 相 
关 的 权威 统计 数据 。 作 为 一 种 折衷 方案 ,本 文选 择 预 
实验 的 方式 ,选取 部 分 用 户 ,观察 其 决策 结果 (用 户 决 
策 是 基于 其 自身 经 历 .感知 所 做 出 的 判断 ,具备 可 信 
EE) ,从 而 确定 概率 p 的 取 值 。 研 究 设 置 4 组 对 照 预 实 
验 ,将 泄露 概率 p 分 别 设 定 为 20% ,3096 ,4096 ,5096 
(过 高 或 过 低 的 泄露 概率 可 能 不 太 符 合 实际 ) ,各 组 预 
实验 的 其 他 参数 相同 。 基 于 预 实验 的 结果 分 布 ,p = 
30% 时 ,用 户 在 VPLP 多 级 价格 表 中 转换 行 号 的 分 布 
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趋 于 正 态 分 布 , 故 选择 概率 p 的 取 值 为 30% 较 合 型 
4.4 正式 实验 
同一 用 户 需 分 别 完成 RFR 计量 正式 实验 和 VPLP 
RFR 实 验 


HH 


去 VPLP 实 验 | 
x 
TES 
元 
您 的 性 别 :| | 田 您 可 获得 125 元 
n 
LULI MES 
您 的 年 级 :| “| 本科 
e 点 击 查看 实验 结果 
适 机 行 号 为 
12 
um fusa 
I 获得 50 元 
ques 


QO 设计 软件 时 ,可 通过 相关 操作 避免 用 户 的 异常 实 
验 季 为。 首先 , 当 用 户 在 多 级 价格 表 的 所 有 行 均 选 择 
B 时 ,系统 自动 拒绝 该 用 户 提交 实验 结果 ;其 次 ， 
在 进行 决策 时 ,只 需 点 击 在 某 一 行 选择 方案 B H 
该 行 以 上 自动 选择 方案 A ,该 行 及 以 下 自动 选择 方 
通过 上 述 操作 设 定 ,一 方面 可 节省 用 户 实验 时 

中 提高 实验 效率 ; 另 一 方面 可 避免 出 现 异 常数 据 。 


5 样本 统计 与 数据 分 析 


5.40 样本 统计 
.全 本 实验 于 2020 年 8 月 实施 ,作者 与 郑州 大 学 情报 
m-— 10. 人 担任 实验 员 , 预 实验 采用 现场 实 
验 男 式 ,正式 实验 采用 网 络 群 组 和 邮件 相 结 合 的 方式 
进行 。 由 于 实验 涉及 到 风险 容忍 度 ,还 需要 在 两 个 表 
格 上 判断 选择 ,比较 复杂 , 受 访 者 需 具备 一 定 的 知识 水 
平 ,因此 ,本 次 实验 选择 郑州 大 学 在 校 大 学 生 和 研究 生 
为 实验 对 象 。 每 位 用 户 在 参与 实验 前 , 需 仔细 阅读 实 
验 步 又 ,理解 实验 内 容 , 同 意 参与 实验 的 用 户 需 与 实验 
组 签订 实验 协议 , 且 可 获得 5 元 报酬 。 
本 实验 共有 275 人 参与 ,用 户 样本 的 描述 性 统计 
结果 见 表 4 ,实验 结果 见 表 5。 
表 4 描述 性 统计 结果 


人 口 统计 学 特征 类 别 人 数 / 人 频率 /% 
性 别 男 133 48.4 
女 142 51.6 
学 历 本 科 108 39.3 
硕士 103 37.5 
博士 64 23.2 


计量 正式 实验 。 所 有 正式 实验 均 通 过 自 编 软件 实施 ， 
自 编 软 件 通过 Unity 工具 和 C# 语 言 实现 ,软件 示例 如 
1 所 示 : 

VPLP 实 验 


去 RFR 实 验 


TITLIITISUTM 


TERCET 


. 点击 查看 实验 结果 
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1 实验 软件 截图 


R5 实验 结果 
类 别 最 小 值 最 大 值 平均 值 标准 差 
RFR -0.14 1.18 0.27 0.25 
VPLP 11 195 89.5 36.7 


(1) 用 户 的 RFR。 用 户 的 RFR 是 基于 用 户 在 RFR 
多 级 价格 表 中 的 选择 开始 从 安全 方案 A 转 到 风险 方案 
B 时 ,方案 A 的 安全 国定 收益 和 方案 B 的 期 望 收益 计 
算 的 。 根 据 RFR 的 计算 公式 , 若 RFR >0, 表 明 当 风险 
方案 B 的 期 望 收益 大 于 安全 方案 A 的 固定 收益 时 ,用 
户 才 会 选择 风险 方案 B ,说 明 该 用 户 不 愿意 承担 风险 
方案 B 的 期 望 收益 低 于 安全 方案 A 的 固定 收益 时 的 
预期 收益 差 , 即 该 用 户 是 风险 厌恶 者 ;同样 道理 , 知 
RFR <0, 则 说 明 该 用 户 是 风险 偏好 者 ; 耕 RFR =0, 则 
说 明 该 用 户 是 风险 中 性 者 。 因 此 ,RFR 计量 实验 结果 
表明 :12% 用 户 为 风险 中 性 者 (RFR =0) ,这 部 分 用 户 
仅 根 据 期 望 收 益 进 行 决 策 。82.5% 用 户 为 风险 厌恶 者 
(RFR 20) ,其 中 有 3.3% 用 户 为 风险 极度 厌恶 者 (RFR 
=1.18, 从 初始 行 开 始 就 一 直选 择 方案 A)。5.5% 用 
户 为 风险 偏好 者 (RFR <0) ,但 并 没有 用 户 从 初始 行 开 
始 就 一 直选 择 方案 B。 没 有 用 户 从 初始 行 开 始 就 一 直 
选择 方案 B 的 原因 是 初始 行 中 风险 方案 B 的 最 大 收益 
不 高 于 方案 A 的 安全 收益 ,用 户 没 必 要 承担 方案 B 的 
风险 , 即 从 初始 行 开 始 就 选择 方案 B 的 行为 不 合理 
《设计 实验 软件 时 ,已 将 此 情况 进行 规避 ) 。 

(2) 用 户 的 VPLP。 实 验 结果 表明 ,RFR 相同 的 用 
户 ,其 VPLP 可 能 存在 不 同 ; RFR 较 低 的 用 户 ,也 可 能 
表现 出 较 高 的 VPLP; 同样 ,RFR 较 高 的 用 户 也 可 能 表 


66 


IK EUG, 


MAA. 泄露 概率 情境 下 的 个 人 数据 隐私 计量 研究 [可 . 


AlL’ Vè OAN M 
lim n/A H 
C hinaA IVE 1 FAI 


图 书 情报 工作 ,2021,65(9 ) :62 -69. 


现 出 较 低 的 VPLP; WTA sk WTP 相同 的 用 户 ,其 VPLP 

可 能 存在 差异 。 综 合 说 明 ,用户 的 VPLP 取决 于 个 
人 隐私 价值 本 身 ( 在 个 人 隐私 确定 被 泄露 的 情况 下 ) 
和 泄露 概率 两 方面 的 因素 。 
5.2 VPLP 与 人 口 统计 学 特征 的 相关 分 析 
通过 K-S 正 态 检验 ,VPLP 的 值 符合 正 态 分 布 (K-S 
正 态 检 验 ,p 20.018) ,因此 对 VPLP 与 人 口 统计 学 特 
征 进 行 相关 性 分 析 时 ,可 采用 独立 样本 了 检验 。 
5.2.1 ”性别 方面 

男性 用 户 的 VPLP 均值 为 81.1, 女 性 为 97.5。 

用 户 性 别 为 分 组 变量 ,对 VPLP 的 值 进 行 独立 样本 
检验 。 结 果 表 明 , 女 ; 和 用户 的 VPLP 显著 高 于 男性 ( 独 


户 学 历 对 VPLP 的 影响 。 
5.3 VPLP 与 问卷 调查 数据 的 相关 分 析 

VPLP 5 WTP,WTA 的 相关 性 分 析 。VPLP、WTP 
和 WTA 的 均值 分 别 为 89.5 .93.8、124.1。 采用 配对 样 
本 TT 检验 ,将 VPLP 与 WTP、WTA 分 别 进行 相关 性 分 
析 。 检 验 结果 表明 ,WTA 显著 高 于 WTP( 配对 样本 了 
检验 ,p<0.001) ,WTP 显著 高 于 VPLP( 配对 样本 T 检 
验 ,p=0.022)。 

根据 上 述 检验 结果 , WTA 和 WTP 均 显 著 高 于 
VPLP。 原 因 是 WTA 和 WTP 均 为 百 分 百 泄露 概率 情 
境 下 的 个 人 隐私 价值 认 知 ,而 VPLP 是 在 隐私 泄露 概 
率 为 30% 情境 下 的 个 人 隐私 价值 认 知 。 在 其 他 条 件 


立 样本 了 检验 ,p<0.001)。 用 户 风险 态度 领域 的 研究 
表明 ,女性 对 风险 的 大 恶 程度 显著 高 于 男性 ”。 隐 私 
ipm 领域 ,已 有 研究 表明 女性 对 其 个 人 隐私 的 价值 认 


知 显 著 高 于 男性 "9 。 而 VPLP 是 用 户 对 港 露 概率 和 
隐私 价值 的 综合 认 知 ,因此 ,女性 用 户 的 VPLP ffi 


是 合理 的 。 
面 。 由 于 本 实验 整体 样本 的 年 龄 跨度 不 是 
fit a 本 文 仅 选择 部 分 有 
TEM Cte e te EO 的 用 户 进行 检验 ,比如 27 
-Q8 岁 学 生 的 VPLP 显著 高 于 18 - 19 岁 的 学 生 (独立 
梯 洒 检验 ,p =0. 014) 。 已 有 研究 表明 ,用 户 随 年 龄 
增 检 ,其 风险 厌恶 程度 会 逐渐 提高 2 。 在 今后 的 研究 
扩大 样本 数量 以 分 析 用 户 年 龄 对 VPLP 的 影响 。 


E、 硕 士 生 和 博士 生 的 VPLP 均值 分 别 为 
5.91.6 和 96.8。 以 学 历 为 分 组 变量 ,两 两 分 组 ,分 
cda VERA T ugs. BrusthiRULde6. 

表 6 独立 样本 工 检验 结果 
独立 样本 T 了 检验 


类 别 


本 科 生 VS. 硕士 生 P 20.115 
硕士 生 VS. 博士 生 P 20.392 
本 科 生 VS. 博士 生 P 0.011 


根据 表 6 ,博士 生 的 VPLP 高 于 硕士 生 , 硕 士 生 的 
VPLP 高 于 本 科 生 ,但 不 存在 显著 性 ,而 博士 生 的 VPLP 
显 车 高 于 本 科 生 。 这 可 能 和 本 文选 取 的 用 户 样 本 有 
关 , 因 为 本 文选 取 的 用 户 样本 均 为 高 校 在 校 学 生 , 每 个 
学 历 层次 之 间 的 学 生年 龄 跨度 并 不 是 很 大 且 存 在 年 龄 
交叉 ,比如 存在 部 分 硕士 生年 龄 小 于 本 科 生 ,部 分 博士 
生年 龄 小 于 硕士 生 等 现象 。 实 际 上 ,已 有 研究 表明 , 受 
教育 程度 会 显著 影响 用 户 对 其 个 人 隐私 的 价值 认 


不 变 的 情况 下 ,隐私 泄露 概率 由 100% 降低 至 30% ,用 
户 对 其 个 人 隐私 价值 认 知 也 随 之 降低 。 因 此 ,在 个 人 
数据 保存 系统 中 ,应 采取 严格 的 隐私 保护 措施 以 降低 
隐私 泄露 概率 从 而 减轻 用 户 隐私 担忧 。 男 外 ,WTA 显 
车 高 于 WTP 的 检验 结果 说 明了 “隐私 悖 论 ” 现 象 的 广 
泛 存在 ,用 户 关注 个 人 隐私 , 却 不 愿意 为 保护 个 人 隐私 
付出 更 多 努力 。 


6 结语 


本 研究 测量 出 受 试 对 象 的 平均 VPLP 约 为 89.5 
元 ,其 中 ,本 科 生 、 硕 士 生 和 博士 生 的 平均 VPLP 分 别 
约 为 83.3 元 .91.6 元 和 96.8 元 。 与 确定 泄露 情境 相 
EE ,泄露 概率 情境 下 ,用 户 对 其 个 人 数据 隐私 价值 认 知 
显著 降低 。 另 外 ,在 VPLP 实验 中 ,有 2.5% 的 用 户 始 
终 拒 绝 选 择 方案 B ,一 方面 可 能 是 因为 该 部 分 用 户 对 
隐私 泄露 概率 风险 的 厌恶 程度 极 高 , 另 一 方面 可 能 是 
因为 该 部 分 用 户 对 个 人 隐私 的 价值 认 知 过 高 导致 其 无 
法 接受 隐私 披露 行为 ,也 可 能 是 两 者 共同 作用 的 结 

本 研究 设计 的 泄露 概率 隐私 价值 计量 模型 对 于 不 
同类 型 个 人 隐私 价值 计量 具备 一 定 的 通用 性 。 不 同 的 
企业 、 机 构 可 根据 其 使 用 目的 选择 不 同类 型 的 个 人 隐 
私 数据 进行 测量 ,比如 在 线 营 销 企 业 可 能 更 关注 用 户 
的 行为 数据 以 用 于 分 析 用 户 的 购物 偏好 ,而 法 院 更 关 
注 容易 产生 纠纷 的 个 人 财务 数据 等 。 需 要 注意 的 是 不 
同类 型 个 人 隐私 数据 的 价值 不 同 , 且 不 同类 型 个 人 隐 
私 数据 的 泄露 概率 也 存在 差异 ,使 用 该 方法 时 应 基 
个 人 隐私 数据 类 型 设置 合理 的 实验 参数 。 

本 研究 的 优点 :具有 隐 含 性 。 采 用 实验 从 用 户 
行为 中 间接 推断 出 泄露 概率 隐私 值 ,而 不 是 用 户 直接 
的 报告 值 。 一 方面 ,有 研究 表明 用户 的 陈述 偏好 通 


A7 。 在 今后 的 研究 中 ,应 扩大 样本 数量 以 分 析 用 


常 不 同 于 观察 到 的 行为 (比如 “隐私 悖 论 ”) ,从 观察 到 


67 


&Q 4i xt 


$865 35 589 Hg. 2021 5£5 月 


ChinaXiv 合 作 期 刊 


的 用 户 选择 中 推断 偏好 ,即使 在 实验 室 相 对 人 为 的 情 
境 中 进行 实验 ,也 比 在 一 个 假定 情境 中 用 户 的 直接 报 
告 更 接近 用 户 的 真实 认 知 ; 另 一 方面 ,隐私 价值 的 直接 
测量 (如 WTA WTP) 迫使 用 户 有 意识 地 选择 答案 ,这 
是 不 可 靠 的 ,因为 用 户 可 能 难以 准确 评 佑 与 隐私 相关 
的 风险 和 损失 ,相关 研究 ””” 表 明 针对 隐私 价值 的 测 
量 ,间接 方法 优 于 直接 调查 。@@ 同 时 考虑 个 人 隐私 内 
容 价值 和 泄露 概率 。 本 研究 设计 的 泄露 概率 隐私 价值 
计量 模型 与 已 有 研究 的 显著 区 别 是 ,前 者 呈现 隐私 汇 
露 的 概率 风险 ,后 者 展示 隐私 泄露 的 确定 威胁 。 因 隐 
私 泄露 遵循 随机 过 程 , 故 隐私 决策 时 个 人 内 容 隐私 价 
值 和 泄露 概率 均 至 关 重 要 。 现 实 中 ,人 们 必须 决定 投 
入 多 少 资金 来 保护 自己 的 信息 免 受 不 确定 的 随机 威 
胁 一 确定 威胁 情境 中 引发 的 隐私 偏好 与 随机 威胁 情境 
中 从 行为 可 能 不 完全 一 致 ,因为 后 者 存在 人 们 的 风险 
厌恶 程度 。 因 此 , 相 比 于 隐私 泄露 的 确定 性 ,隐私 披露 
将 岩 机 风险 性 更 符合 实际 ,也 更 客观 , 故 更 具有 研究 价 
fi 
读本 研究 的 局 限 性 主要 体现 在 隐私 泄露 概率 取 值 和 


bm | 
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诗话 据 而 无 法 基于 隐私 泄露 的 实际 情况 进行 取 值 ,本 
EB 于 枯 实验 的 结果 分 布 ,将 隐私 洪 震 概 率 设置 为 
3096, 可 能 存在 一 定 实验 误差 ;@ 为 了 方便 调查 , 本文 

驮 的 用 户 样本 均 为 郑州 大 学 在 校 学 生 ,用 户 样本 缺 

汉 航 域 广泛 性 和 人 口 统计 学 特征 多 样 性 ,今后 的 研究 

ec 并 面 要 扩大 用 户 样本 的 地 域 禾 盖 范 围 以 避免 地 域 经 

济 光 化 等 宏观 因素 影响 , 另 一 方面 要 扩大 用 户 样本 的 

社 代 复 盖 范围 ,以 分 析 人 口 统计 学 特征 (尤其 是 受 教育 

程度 .年龄 .职业 等 个 体 因素 ) 对 VPLP 的 影响 。 
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(© Abstract; [Purpose/significance| Compared with the situation in which the probability of personal data leak- 
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-age is 100 percent, the situation in which personal data is leaked with a certain probability is more common. Thus, 
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s paper aims to measure users’ personal data privacy value under the certain probability of privacy leakage, which 
puts forward a new perspective of privacy measurement and the measurement results are of practical significance to 
privacy classification protection. | Method/process | Based on the multiple price list, the user’ s return on financial 
risk is measured. Modified the implementation mechanism of multiple price list to elicit users" decisions between the 
risk-free scheme and the scheme with the probability of privacy leakage. Based on the above steps, value of privacy 
under leakage probability of users can be measured. | Result/conclusion | When the probability of privacy leakage is 
3096 , users’? average VPLP in the social networks is about RMB 89.5; at the same time, when the probability of 
privacy leakage is 10096 , users’ average "willing to accept" and "willing to pay" of personal data in the social net- 
works is about RMB 124. 1 and RMB 93.8. Users? VPLP depends on the value of personal privacy itself and proba- 
bility of privacy leakage. 
multiple price list mechanism 
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